Ứng dụng trong thực tế cuộc sống, tiềm năng trong tương lai và những kỳ vọng về công nghệ Giao diện giọng nói người dùng

Ứng dụng trong thực tế cuộc sống

Đối với người dùng, họ không chỉ muốn biết rằng một hệ thống đã nhận được yêu cầu hay chỉ đơn giản là xác nhận thông tin mà họ còn muốn hệ thống sẽ hiểu họ đang nói gì, nghĩ gì và mong muốn điều gì. Cảm giác này đóng một vai trò quan trọng trong việc thiết lập một mức độ tin cậy lớn hơn, tạo niềm tin nơi người dùng và tăng trải nghiệm người dùng, đồng thời thể hiện sự tương tác rõ rệt hơn giữa con người và máy móc.

Năm 2016 nhằm đánh dấu kỷ niệm 100 năm thành lập của công ty mẹ BMW, mẫu xe điện 103EX ra đời và là chiếc xe điện tự lái đầu tiên của Rolls-Royce có khung gầm được chế tạo thủ công bằng vật liệu tiên tiến. Xe không có vô lăng trong cabin, nhiệm vụ lái xe được đảm nhiệm bởi Eleanor, một trợ lý ảo và tài xế ảo để tương tác với hành khách. Chúng có thể hiểu được những câu lệnh của hành khách và thực hiện những câu lệnh đó.[14]
Những ông lớn công nghệ như Samsung hay LG đang phát hành tủ lạnh có nhận dạng giọng nói. Ứng dụng ThinQ của LG cho phép quản lý tất cả các thiết bị LG có hỗ trợ wi-fi bao gồm máy giặt, máy sấy, tủ lạnh, lò nướng, máy rửa chén, máy hút bụi, máy điều hòa không khí,... Khi sử dụng, người dùng có thể yêu cầu ứng dụng ThinQ kiểm tra thời gian còn lại sau khi giặt hoặc điều chỉnh nhiệt độ của điều hòa trong khi lái xe về nhà mà không cần phải nhìn vào màn hình điện thoại. Ứng dụng cung cấp thông tin hữu ích về các tính năng và chức năng của sản phẩm và cảnh báo cho người dùng về các vấn đề bảo trì và khắc phục sự cố. Chẳng hạn như chỉ cần hỏi: "Chức năng tự động lọc không khí hoạt động như thế nào ?" hoặc "Đèn vàng trên tủ lạnh có nghĩa là gì ?" thì người dùng sẽ nhận được phản hồi nhanh chóng ngay trong ứng dụng.[15]
Tổng đài trí tuệ nhân tạo Vbee AI Call Center giúp thay thế 70% con người trong những công việc chăm sóc khách hàng đơn giản, có tính lặp lại như xác nhận đơn hàng khảo sát thị trường,... hay những trường hợp truyền tin khẩn cấp dịch bệnh, trợ lý ảo, báo nói tự động, chatbot, các giải pháp tích hợp IOT (Loa thông minh, nhà thông minh),...

[16]

Tuy nhiên các hệ thống VUI hiện nay vẫn chưa thể giải thích hết được những mệnh lệnh được yêu cầu bởi người dùng khi được hỏi lại bởi vì bản chất chúng không phải con người nên chúng không hiểu được ý nghĩa của những câu lệnh đó. Và mong muốn của người dùng chính là trong tương lai hệ thống VUI có thể dự đoán những hành vi của người dùng thông qua những lần tương tác trước đó, ghi nhớ để có thể đưa ra đề xuất, chuẩn bị sẵn sàng những việc sẽ xảy ra.

Ứng dụng tiềm năng trong tương lai

Công nghệ VUI dự báo trong tương lai sẽ xuất hiện nhiều trong các lĩnh vực khác trong cuộc sống như ở nơi làm việc, khu vườn, lớp học hay trạm xe buýt...

VUI cũng được kì vọng phát triển ngành Marketing vào hoạt động như một công cụ marketing mới giúp doanh nghiệp thiết lập mối quan hệ tương tác mạnh mẽ với khách hàng, tìm kiếm những khách hàng mới, đặc biệt là trong tiếp thị đàm thoại (conversational marketing). Tiếp thị đàm thoại là cơ hội tốt nhất để thực hiện những giao dịch mang tính cá nhân hóa thông qua các thiết bị thông minh như điện thoại, laptop,... và khi VUI càng phát triển thì những cơ hội và tiềm năng của tiếp thị đàm thoại sẽ càng được khai thác hiệu quả. Khi mà lúc này doanh nghiệp có thể tạo ra cuộc hội thoại như là một trải nghiệm trò chuyện trực tiếp với khách hàng thông qua VUI, đem lại cảm giác thân mật và mang tính cá nhân trong quá trình tiếp thị. Để khai thác được những tiềm năng này, cần phải có sự kết hợp chặt chẽ và cẩn thận của hệ thống VUI và các chuyên gia marketing để thiết kế được một hệ thống phù hợp, đúng mục đích và đạt hiệu quả cao.[17]

VUI cũng sẽ có lợi cho người dùng máy tính cỡ laptop và máy tính để bàn, vì nó sẽ giải quyết được nhiều vấn đề hiện nay liên quan đến việc sử dụng bàn phím và chuột, bao gồm các chấn thương do sử dụng bàn phím liên tục và tốc độ gõ chậm của người dùng bàn phím thiếu kinh nghiệm. Từ những hướng phát triển như vậy, các thiết bị di động sẽ được thiết kế với màn hình lớn hơn, dễ dàng hơn vì không cần dùng đến bàn phím. Các thiết bị màn hình cảm ứng sẽ không còn cần phải phân chia màn hình giữa nội dung và bàn phím trên màn hình, do đó có thể cung cấp chế độ xem toàn màn hình cho nội dung của chiếc điện thoại. Máy tính xách tay về cơ bản có thể bị cắt giảm một nửa về kích thước, vì một nửa bàn phím sẽ bị loại bỏ. Máy tính để bàn sẽ chỉ bao gồm CPU và màn hình, tiết kiệm không gian khi có thể loại bỏ phần còn lại của bàn phím trượt được xây dựng dưới bề mặt bàn. Các thiết bị khác cũng sẽ có được không gian rộng rãi hơn mà không còn quá cồng kềnh như tivi có thể điều khiển từ xa đến những nút điều chỉnh trên lò vi sóng hay các máy photocopy cũng có thể được loại bỏ.

Những kỳ vọng về công nghệ

Xử lý các câu lệnh phức tạp hơn

VUI được kỳ vọng có thể xử lý nhiều công việc cùng một lúc. Đầu năm nay, Google đã bắt đầu triển khai hỗ trợ nhiều lệnh cho Google home. Bây giờ nó có thể hỗ trợ tối đa 3 yêu cầu trong cùng một câu. Chẳng hạn như: "Này Google, cho tôi biết vị trí nhà hàng BBQ Nhật Bản gần đây, thời gian đi là bao lâu và đề xuất cho tôi phương tiện đến đó". Google hiện có thể hiểu các lệnh cơ bản khi được xâu chuỗi lại với nhau trong một câu. Tuy nhiên, nó vẫn còn là một thách thức với các lệnh phức tạp và câu nhiều mệnh đề. Ngay cả khi VUI có thể xử lý các câu hỏi phức tạp, nhưng chúng cần phải được hỏi theo một cách rất cụ thể thì thiết bị mới có thể hiểu được câu lệnh đó.

Bối cảnh

Một thiết bị có thể chứa bộ nhớ của các tương tác trước đó có thể giúp thiết bị hiểu được các yêu cầu trong tương lai của người dùng. Chẳng hạn như khi người dùng muốn hỏi rằng: "Từ nơi tôi đang đứng đến sân bay Tân Sơn Nhất mất thời gian bao lâu ?", hệ thống trả lời rằng "Mất 30 phút". Người dùng ra câu lệnh là "Đặt cho tôi một chiếc taxi" và hệ thống sẽ trả lời được rằng: "Chắc chắn rồi. Bạn có muốn tôi đặt một chiếc taxi đến sân bay Tân Sơn Nhất hay một nơi nào khác ?"

Việc ghi nhớ những hoạt động trong quá khứ này sẽ giúp cho người dùng tiết kiệm thời gian và cũng cảm thấy dễ chịu hơn thì không phải lặp đi lặp lại những câu lệnh cũ quá nhiều lần. Cách ghi nhớ về linh hoạt theo bối cảnh là một tính năng rất được mong đợi, nó cần được sử dụng bằng trực giác. Nếu một người dùng hỏi về sân bay Tân Sơn Nhất cho một người bạn, điều đó sẽ không liên quan đến họ. VUI cần phải có khả năng hiểu Khi nào bối cảnh hữu ích cho người dùng và khi nào nó không thích hợp với hoàn cảnh khi tương tác. Điều này có thể được thực hiện bằng cách tham chiếu chéo các sự kiện lịch hoặc bằng cách học hỏi từ dữ liệu người dùng về các ví dụ tương tác trước đó qua việc ứng dụng học máy.

Nhận thức

Việc nhận thức này sẽ trở nên hiệu quả khi kết hợp với bối cảnh. Nhận thức về các thiết bị hiện tại, vị trí và các tương tác gần đây tạo thành ảo giác về nhận thức. Nếu thiết bị biết rằng người dùng đang ở nhà thay vì ở nơi làm việc, việc tìm kiếm vị trí có thể phù hợp hơn. Nếu thiết bị biết rằng người dùng đã xem các món ăn ở một trang web của cửa hàng thức ăn Hàn Quốc thì rất có thể họ đang muốn ăn món ăn đó. Nếu thiết bị có thể tham chiếu chéo với lịch của người dùng, nó có thể xác minh ngày mà họ đang truy cập vào những trang web nào. Hệ thống này sẽ có thể hiểu được hành vi của người dùng và dự đoán được những nhu cầu cũng như mong muốn của họ.

Nếu một ngày thiết bị thông minh của người dùng có thể cung cấp cho người dùng mọi thứ người dùng cần cho cả ngày dựa trên các thông tin lịch trình trước đây của người dùng. Chẳng hạn như thứ hai người dùng sẽ thức dậy lúc mấy giờ, người dùng sẽ rời khỏi nhà để đi đâu, người dùng đi bằng gì và người dùng sẽ ăn trưa chỗ nào,... Từ đó, thiết bị sẽ cung cấp thông tin hợp lý và chính xác cho người dùng như ghi nhớ báo thức, gợi ý phương tiện đi lại cho người dùng và nhà hàng người dùng hay ăn.

Đồng cảm về ngôn ngữ

Khi người dùng cảm thấy rằng trợ lý cá nhân của người dùng là người cũng có cách nói chuyện, sở thích và tính cách giống như người dùng thì điều đó sẽ làm tăng sự tin tưởng của người dùng dành cho họ. Chẳng hạn như nói chuyện với trẻ em bằng những từ đơn giản hơn và những câu lệnh ngắn hơn để trẻ em có thể hiểu được những gì thiết bị đang nói. Thiết bị này cũng đã và đang được thử nghiệm với Pretty Home của Google Home, một tính năng có thể được kích hoạt để khuyến khích trẻ em lịch sự khi sử dụng Google. Khả năng VUI thực hiện điều này sẽ tự động phá vỡ các rào cản ngôn ngữ hơn nữa, đảm bảo rằng người dùng và VUI đều nói cùng một ngôn ngữ.

VUI đôi khi có thể hiểu tạm dừng trong lời nói là một gợi ý để bắt đầu trả lời một câu hỏi. Điều này không chỉ gây khó chịu cho người dùng mà trợ lý sẽ không thể hiển thị thông tin chính xác từ một câu chưa hoàn thành. Bằng cách học các mẫu giọng nói, các thiết bị sẽ có thể hiểu khi người dùng tạm dừng hoặc kết thúc yêu cầu của họ. Điều này cũng có thể tiến thêm một bước và giao tiếp với những đối tượng, ngữ cảnh khác nhau dựa trên tính cách, tâm trạng và tuổi tác của người dùng.[18]